УЧЕТ ОГРАНИЧЕНИЙ СТРУКТУРЫ 8 УСЛОВИЯХ ОПТИМАЛЬНОСТИ

Рассмотренный метод определяет условия оптималь­ности управления u(t) (2.30) в произвольном классе ку­сочнонепрерывных функций. При этом оператор связи управления и с наблюдаемым вектором z(t) также про­извольный.

Часто представляют интерес задачи оптимизации уп­равления при заданном классе операторов связи и с г. Такие задачи далее будем называть задачами оптимиза­ции систем с заданной структурой.

Одним из возможных путей решения этой задачи яв­ляется математическая формулировка условий выделе­ния класса операторов. В этом случае при оптимизации накладываются такие ограничения, которые при исполь­зовании метода (см. 2.2) приводят к заданному виду опе­ратора, связывающего и с z{t). Однако этот путь, как правило, достаточно трудоемок.

Повидимому, более перспективен метод задания вида оператора и определения условий оптимальности при непосредственном вычислении его вариации. Далее мы предположим, что оператор связи управления с наблю­даемой реализацией# (t) является линейным

Подпись: о (2.56)

либо стационарным линейным оператором

image37(2.57)

В этих выражениях w является матрицей импульсных переходных функций (гХ/), которая определяется при решении вариационной задачи.

Для определенности будем также считать, что в за­даче оптимизации 2.1 наблюдаемый вектор z(t) опреде­ляется выражением (2.12).

z(t)=Cx + n. ‘ (2.58)

В связи с тем, что вид условий оптимальности суще­ственно зависит от вида оператора объекта управления (2.2), ниже будут рассмотрены задачи, когда операторы

Подпись: Рис. 2.1. Структурная схема системы управления объекта и управляющего воздействия принадлежат к одному классу и к раз­ным Классам операторов. Отметим, что выделение оператора объекта наряду с оператором управления w необходимо только тогда, когда оператор объекта принадлежит к классу, более общему, чем оператор управления, или они принадлежат к разным классам. Если же оператор объекта принадле­жит к классу операторов управления, их комбинацию при бнтимизации можно рассматривать как единый оператор, поскольку это преобразование не расширяет класса ва­риаций оператора управления. Разделение операторов в этом случае может быть проведено после решения за­дачи оптимизации методом структурных преобразований.

Определим условия оптимальности оператора управ­ления w в типичных задачах оптимизации для системы с заданной структурой, схема которой представлена на рис. 2.1.

Задача 1. Оптимизация линейного оператора
управления нелинейным объектом

В этой задаче объект управления описывается систе­мой уравнений (2.2), а оператор управления выражени­ем (2.56). Поскольку управляющее воздействие опреде­ляется здесь в открытой области, к решению применим метод классического вариационного исчисления, состоя­
щий в приравнивании к нулю первой вариации функцио­нала

/=M{F[*(01+-*o(a. (2.59)

В выражении (2.59) обозначено

*о(*»)=jVo(*. в> <)<#• (2.60)

Операция математического ожидания осуществляет­ся в (2.59) по начальным условиям я0, возмущениям %(t), n(t) и не зависит от управления. Поэтому вариация функционала 61 может быть записана в виде

8/ = ж[-^^-8лг(У + 8лг0(и] (2.61)

с точностью до бесконечно малых величин a*(fB). Ана’ логично [13] введем вектор-функцию ф(0 размерности (п +1) X1 такую, что

-Ы=м [*г(*в) 8* (*.)], (2.62)

где вектор — X={xo, Xi….. х„}. Выражение (2.62) можно

УЧЕТ ОГРАНИЧЕНИЙ СТРУКТУРЫ 8 УСЛОВИЯХ ОПТИМАЛЬНОСТИ Подпись: (2.63) (2.64)

записать в виде

которой удовлетворяет расширенный вектор фазовых ко­ординат, можно записать систему уравнений в вариаци­ях [15] с точностью до 6*

Подпись: (2.65)dbx =д/(х, a, g, t) , а/(ж, «, 1, t) Ьа dt дх да

где df/dx и df/dtt матрицы частных производных с элементами dfi/dxj и dfilduk (і, j—0,1,…, tv, k = , 2,…, г).

Вариация управления 6 и определяется с точностью до величин Ьх из (2.56) и (2.58) выражением

. «в

8и(i) = J bw(t, x)z{x)—w{t, x)Cbx{x)dx. (2.66)

^ о

Условие (2.62) определяет значения вектора ф(<) в момент tB. Сравнивая (2.62) и (2.61), получаем

‘ЫО=-1, ^=—^77?-; i=h

(2.67)

Определим далее ф(/) при t0^t<iB системой урав­нений

dt L дх J

— Ст J wT (т, t)(Хди“’ Х)-}ТФ (T)dx. (2.68)

t

Тогда

[іьі )

8/ =м К dt^ dxtf (0 — f—XdaU’ 0 (*, т) г (т) . (2.69)

Л) ^ о

Рассматривая в качестве условия оптимальности ра­венство нулю вариации функционала (2.69), получаем для произвольной вариации 8w(t, т)

М {[д/(Х’да ^ Г*W zT{X)=0; < т < * < *»»

(2.70)

или обозначив

Я(ф, X, и, *)=4>г'(0-л V, й, І, t), (2.71)

УЧЕТ ОГРАНИЧЕНИЙ СТРУКТУРЫ 8 УСЛОВИЯХ ОПТИМАЛЬНОСТИ Подпись: К 7

получим необходимое условие оптимальности линейного оператора управления w (t, т) в компактной форме

где tp(t) определяется системой интегродифференциаль — ных уравнений (2.68).

УЧЕТ ОГРАНИЧЕНИЙ СТРУКТУРЫ 8 УСЛОВИЯХ ОПТИМАЛЬНОСТИ Подпись: =0; Подпись: (2.73)

Для сравнения отметим, что для произвольного опе­ратора управления условия оптимальности при опреде­лении и (t) в открытой области следуют непосредствен­но из соотношения (2.30) и имеют вид

где вектор-функция г|:(г) определяется системой диффе­ренциальных уравнений (2.34).

Задача 2. Условия оптимальности линейного
стационарного оператора управления
нелинейным объектом

Отличие этой задачи от предыдущей состоит в том, что ядро оператора управления до(т) в выражении (2.57) является функцией одной переменной и может быть реа­лизовано звеньями с постоянными параметрами.

Поэтому вариация бда(т) также будет функцией од­ной переменной

t-to

Ьи(t)= j [8ю(т)г(*—т)+ю(і)Сї*(/—т)]</т. (2.74)

Если аналогично предыдущему потребовать, чтобы ф(^) удовлетворяла системе уравнений

X [а/(^’иЮ’ Т)]Г * СО dx (2.75)

Подпись: Ь1=М image39

с конечными условиями (2.67), вариация функционала I будет определяться выражением

УЧЕТ ОГРАНИЧЕНИЙ СТРУКТУРЫ 8 УСЛОВИЯХ ОПТИМАЛЬНОСТИ Подпись: (2.77)

При произвольной вариации 6w{x) получим необхо­димое условие оптимальностиw (т) в виде системы rXl уравнений

Трудности использования условий (2.72) и (2.77) со­стоят в решении интегродифференциальных уравнений (2.68) и (2.75) для определения ф(^).

3 а д а ч а 3. Условия оптимальности линейного оператора управления линейным объектом

Пусть система уравнений (2.2) является линейной

x=Ax—Buu+Bvv—{t) x{t0)=x°, (2.78)

где матрицы А, Ви, Bv определены в (2.10), а воздейст­вие v(i) имеет известные статистические характеристи­ки. Введем матрицу импульсных переходных функций K(t, tj[ объекта размерности (пХи). По определению она удовлетворяет дифференциальному уравнению при t^x: . _

dJ^jL=AK(t, x), К(х, х)=Е, (2.79)

at

где Е — единичная матрица (пХп). При этом x(t) опре­деляется выражением

-*«=*(*, gAT° + J/C(/, т)[Дв»(т)+/?„®(т) +

to

+ |(т)]</т. (2.80)

Если привести воздействие ко входу оператора управ­ления в виде сигнала y(t), то схема на рис. 2.1 может быть преобразована к виду, представленному на рис. 2.2, где

y{t)=n{t)+CK{t, U)x°+C^K{t, х)Х


Подпись: Рис. 2.2. Приведенная схема системы управления

Обозначим далее через Q (I, т) матрицу импульсных переходных функций размерности (rXl) замкнутой си­стемы рис. 2.2 с входом в точке приложения у (t) и вы­

ходом u(t). Точка Q(t, т) удовлетворяет уравнению, ко­торое в компактной форме может быть записано в виде

Подпись: (2.82)Q=w— w ® СКВ © Q,

где с помощью знака ® записано выражение свертки операторов. Например:

Подпись: X

a® b=ja(t, x)dK

При этом вариация управления равна

8а(0=]’8^(Ст)у(т)</т, (2.83)

поскольку в отличие от выражения (2.66) у(t) является внешним воздействием.

УЧЕТ ОГРАНИЧЕНИЙ СТРУКТУРЫ 8 УСЛОВИЯХ ОПТИМАЛЬНОСТИ Подпись: (2.84)

Если оператор управления нестационарный (2.56), то вариации бQ(t, т) — произвольные функции. В этом слу­чае, записывая выражение для вариации функционала в виде (2.63), подставляя выражения (2.83) и определяя вектор-функцию ф(^) системой уравнений

image41

с начальными условиями (2.67), получим необходимое условие оптимальности w(t, т):

Выражение для гамильтониана Я может быть полу­чено из условий (2.81) и (2.78):

Н{х, <К в, t)=%fQ(x, в, 0+*l>r-(A*-|-/?aa-J-Z?^-H).

(2.86)

Задача 4. Условия оптимальное! и линейного
стационарного оператора управления
линейным объектом

Предположим, что объект управления описывается си­стемой уравнений (2.78), где матрицы Л, Ви> Bv зависят от времени, а оператор управления линейный и стацио­нарный (2.57).

Особенностью этой задачи является зависимость ва­риаций 6Q(t, т) при варьировании 6ге>(т), так как по­следняя представляет собой функцию одной переменной. Для установления связи между вариациями бQ и б w рассмотрим схему на рис. 2.2. Для обратной матрицы импульсных переходных функций Q~l(t, т), которая оп­ределяется уравнением [16]:

Q^Q-^Eb, (2.87)

где 8=8(/—т)—дельта-функция, имеем

x)=w-1{t-‘c)+QK{t, x)B. (2.88)

Из (2.87) можно выразить вариацию обратной функ­ции 6@-1Я> т) через вариацию бQ{t, т). Пренебрегая сверткой вариаций 6Q-1®8Q как бесконечно малой бо­лее высокого порядка по сравнению с бQ, получаем

8Q-1 = — Q-i ® 8Q ® Q-1. (2.89)

Аналогично для вариации бго-1 имеем

8о>-1 = — w~l ® 8 до ® го-1. (2.90)

Поскольку до(т) является стационарным оператором, 8ДО-1 в (2.90) также будет стационарным, т. е. функци­ей одной переменной.

Определяя далее 6Q-1 из (2.88), получим окончатель­но с помощью уравнений (2.89) и (2.90)

bQ = Q®bw* ® Q,

где б го* — вариация стационарного оператора.

Выражение (2.91) определяет класс вариаций им­пульсной переходной функции системы (см. рис. 2.2), как функции двух переменных t ит при изменении стацио­нарного оператора управления, импульсная переходная функция w{%) которого является функцией одной пере­менной. Оно может быть использовано для определения вариации 6u(t). Поступая далее аналогично задаче 3, получим необходимое условие оптимальности w(x) в ви­де уравнения

Подпись: дН (х, ф, и, О ди ‘в /-9 /

^ dt ^ dxM у(х)

*0 + 0 *о 0 +т

XQT(l-B, т)=0; (2.92)

Здесь Я(ф, х, и, /) определяется выражением (2.86), ф(£) удовлетворяет системе уравнений (2.84).

3 а д а ч а 5. Условия оптимальности линейного
стационарного оператора управления
линейным стационарным объектом

В этой задаче предполагается, что w является функ­цией одной переменной, а матрицы А и Ви в уравнении объекта (2.78), как и матрица С в измеряемом векторе г (2.58), постоянны.

При этих условиях замкнутая система, изображенная на рис. 2.2, будет описываться стационарным линейным оператором, т. е. Q является функцией одной переменной и ее вариации при изменении w(x) независимы. Поэтому

/-*0

bu{t)= j* 80(т)з>(^-т)аГт (2.93)

о

УЧЕТ ОГРАНИЧЕНИЙ СТРУКТУРЫ 8 УСЛОВИЯХ ОПТИМАЛЬНОСТИ Подпись: ;0;

и условия оптимальности получаются аналогично зада-‘ че 3 в виде системы (гХ/) уравнений

0<т<гв —(2.94)

чае (2.94) иногда удобно записывать, придавая вариа­цию матрице импульсных переходных функций Qx замк­нутой системы (рис. 2.2) со входом y(t) и выходом объекта K{t — т). Согласно рис. 2.2

■*(*)—+ £(*). (2.95)

image42 Подпись: (2.96)

где

Полагая В=Е и г=п, где Е — единичная матрица размерности (пХп), получим связь между Q(t) и Qі(т) в виде

Q(x)=jK~1(x-B)Q1(e)dB. (2.97)

УЧЕТ ОГРАНИЧЕНИЙ СТРУКТУРЫ 8 УСЛОВИЯХ ОПТИМАЛЬНОСТИ
Условие оптимальности Q может быть получено за­меной вариации 6 Qua вариацию из (2.97) и имеет вид

image43

где/С_1(т — 9)—обратная матрица импульсных пере­ходных функций объекта. Управление u(t) через функ­цию Q і определяется выражением

В связи с тем, что система телеуправления часто мо­жет быть приведена к стационарной системе, рассмотрим частные случаи полученного условия (2.98).

Если время наведения tB — to много больше времени переходного процесса по координатам х, можно считать, что система в момент /в находится в установившемся со­

стоянии и положить t0 = —о°. В этом случае условие (2.97) примет вид

J dt ^ dxK~XT (т — 6) [дН (х—*и 0 ]Г ут (t-

r)J=0.

—ОО 0

(2.100)

Для квадратичной функции потерь имеем

(2.101)

/о(ЛГ, И, t)=UTQU,

(2.102)

где Р — симметричная неотрицательная постоянная мат­рица размерности (пХп), а @ — положительно опреде­ленная симметричная матрица (ґХг). Условие (2.100) может быть сведено к многомерному уравнению Винера — Хопфа [17] для задачи Ньютона с учетом ограничения дисперсии управления.

Для функции Я уравнения (2.84) относительно ф(0 можно записать в виде

(2.103)

dt

с конечными условиями

ф (0=-2А*(*в). (2.104)

Решение этой системы уравнений, которая является сопряженной системе (2.100), можно записать в виде

Фо= — 1;

ф(0=-^2/Г(*в, f)Px{tu (2.105)

При этом

[£]’-2 аге — 2 * (QP К (*„, 0, (2.106)

[

д Н 1 т

-^-1 —вектор-строка размерности (1Хя). Если

процессы y(t) и g(t) (2.81) и (2.96) стационарны и ста­ционарно связаны и

Я(*)=Е—Гп+1 , Фп+2—скаляр, (2.107)

-в — ‘0

то условие (2.100) при t0—мх> простыми преобразова­ниями может быть приведено к виду уравнения Ньютона [13], откуда получаем:

*]<?!(*)*,(в“Т)Л + Я,,(в) +

+ <1»л+2 f dx j dl [k~XT (t) k-1 (X) <?! (p.) Ry (6 + t — fi — X)],

о о 0

0 < 0 <oo, (2.108)

где Ry и Rgv — корреляционная матрица у (і) и взаим­ная корреляционная матрица процессов y(t) и g(t). По определению

*,(в)=ЛЛУ(0У(*-в)],

(2.109)

^(в)=Л1[у(0У(<-в)].

Задача 6. Условия оптимальности в линейной
стационарной системе с конечной памятью

Для системы с конечной памятью Т {16] на интервале времени t — t0, большем памяти системы,

г

u{t)=^Q{x)y{t-x)dx (2.110)

x{t)=j <?i(T)y(<-T)rft + g(0, (2. Ill)

0

где О (т) и Qi (т) — матрицы импульсных переходных функций, определенные выше и’связанные между собой соотношением (2.97).

Преимущества систем с конечной памятью состоят в возможности задания времени переходного процесса с помощью памяти Т и необходимостью статистического описания воздействий лишь на конечном интервале вре­мени, равном памяти системы.

Обычно на интервале памяти системы (t, t — Т) воз­действие g(t) (2.96) при %(t) = 0 может быть представле­но конечным отрезком ряда, являющегося разложением g(t) по системе ортогональных функций [16]. В частности,
предположим, что g(t) может быть представлено полино­мом степени т:

(2.112)

І — 1

Подпись: Поскольку то y(0=«W+Cff(0, (2.113)

т Т тп

Подпись: /-1X (/) ==2 ] <?1 W С А’ (* — т)’Л +2 Alt’ +

і—1 о

—[Q1{x)n{t-x)dx. (2.114)

о

Из (2.114) следует, что по отношению к измеряемым компонентам g(t) n&Q(x) может быть наложено усло­вие несмещенности, состоящее в том, что система (т) осуществляет заданное преобразование сигнала g(И с нулевой или заданной ошибкой. При этом на компонен­ты матрицы Qі накладываются условия вида

г

|^і^(т)т*а1т=С/;, (2.115)

U

где Ckij специально подобранные постоянные. Условия (2.115) обычно называют моментными условиями, а зна­чения определяют величину динамической ошибки.

Задача оптимизации системы при условиях (2.115) сводится к обеспечению минимума функции от случайной составляющей x(t)

т

лг(/)= J Q1(r)n{t—x)dx (2. 116)

и

при!(£)=0. Поскольку в этом случае динамическая со­ставляющая управления u(t) определена, ограничение на управление состоит в обеспечении пределов статистиче­ских характеристик составляющей управления, опреде­ляемой n(t):

т

и(0=|«?(т)и(г‘-т)аГт. (2.117)

В этих условиях при стационарном случайном про­цессе ограничение на управление для функции /0 (2.102) и е (2.107) эквивалентно ограничению дисперсии управ­ления. Например, в одномерном случае оно имеет вид

Л* [«■(*)]< С,. (2.118)

Таким образом, для стационарной системы с конеч­ной памятью задача оптимизации сводится к определе­нию импульсной переходной функции Q (т), удовлетво­ряющей моментным условиям (2.115) и обеспечивающей минимальную среднюю величину

I = M{F{x(t))} (2.119)

при t — t0^T и условии, что управление имеет ограни­ченную дисперсию, которая в одномерном случае опре­деляется по выражению (2.118).

Эта задача (при n=r—l= 1) сводится к минимиза­ции функционала, когда t — to^T:

т ГГ -1

I=M{F И0] + «2(*)1 | Qi(t)Fdx-СЛ

УЧЕТ ОГРАНИЧЕНИЙ СТРУКТУРЫ 8 УСЛОВИЯХ ОПТИМАЛЬНОСТИ

Придавая Q (т) вариацию 6Qi и учитывая связь меж­ду Qi и Q (2.97), получим условие оптимальности систе­мы в виде, ,

0<6<7’

Здесь фп+2 постоянная величина, введенная в (2.107), которая может рассматриваться как множитель Лагран­жа, определяемый из условия (2.118); Яд, k=, 2……. тп

множители Лагранжа, определяемые из моментных ус­ловий (2.115). Если (t) = 0, то

yc*(t)=n(t) + rt(t) (2.122)

совпадает с n(t) и

t — 9 — v)=iV28(б — p, — Я-f-v). (2.123)

Поскольку x(t) связан с y(t) линейным преобразо­ванием, то для нормально распределенного воздействия y(t) выходной сигнал системы Qi также будет нормаль­ным. Легко показать, что в этом случае для четной функ­ции F[x будет оптимальной импульсная переходная функция Qu обеспечивающая минимум среднего квад­рата x(t):

/=М [**(*)]• (2.124)

Действительно, по определению двумерной плотности вероятности р (х, у)

00 00

ЖГ’І7^]== ~^p(x>)dx ] УРШ*у. (2.125)

—00 —оо

Как известно [14], для нормального закона распре­деления

yp(ylx)dy = -^x, (2.126)

J UX

где Rxy — взаимная корреляционная функция процес­сов у их; Dx — дисперсия x(t).

Подставляя (2.126) в (2.125), получаем

M^y=Wx«, (2.127)

где Хо — постоянная величина (так как хну стацио­нарны), равная

оо’

Y~xp{x)dx=. (2.128)

Таким образом, для нормального закона распреде­ления

М (2.129)

что эквивалентно рассмотрению в качестве критерия оп­тимизации

Подпись: F(x)=x2.(2. 130) 73

Подставляя в (2.129) выражение т

x{t)= r)dx, (2.131)

6

получаем

т

Ж["|^^-0)] = ЦОі(т)/?^-Т’ t-b)dx.

о

(2. 132)

Множитель Я, о в (2.121) может быть исключен из рас­смотрения, поскольку %h (fe=l, 2,…, m) и фп+2 произ­вольные.

В частном случае, когда импульсная переходная функция объекта k(x) определяется уравнением

L(p)k(%)=h(T), Р=-^~, (2.133)

аХ

где L(p) —полиноминальный оператор от р степени п

L(p)=^atp> (2.134)

/-0

условие оптимальности (2.121) с учетом (2.123) сводит­ся к дифференциальному уравнению

£(/W-/0Qi(e)+1wA(®)+2**e*=O, (2.135)

ft-1

О<0<7*

где фп+2, — постоянные, определяемые из условий

(2.118) и (2.115).

Поскольку Qi(0) соответствует системе с конечной памятью Т, то

<?і(в)=0, 0 > 0 > Г. (2.136)

Для объекта (2.133)

Q(e) = L(p)Q1(B Р=-^-, (2-137)


ций и их производных. В соответствии с этим условием и (2.137) Qi(0) должна иметь непрерывные производные до п— 1 в интервале включая граничные точ­

ки. Так как Qi(0) тождественно равна нулю вне интер­вала (О, Т), то равны нулю и все ее производные до п— 1 в точках 0 = 0 и 0 = 7 Поэтому уравнение (2.135) должно решаться при граничных условиях

Ci° (Г)=(0)=0, /=0, 1…Я-1. (2.138)

При постоянных коэффициентах оператора Ь(р) ре­шение уравнения (2.135) может быть записано в виде

п тп

Qi(fl)=2 [Bfi’fi + Bfi-‘t] + (2. 139)

г-і fc-i

где сїі — корни самосопряженного дифференциального уравнения

1(а)1(-а)+фл+2=0, (2.140)

а постоянные В,- и В’, определяются из условий (2.138), которые приводятся к системе 2п уравнений

2 «* [В1.^4(-1)^^а’г]=0,

/-1

2a?[?( + (-lK-]=0. (2.141)

І-1

k = Q, 1,… п.

Дисперсия сигнала x(t) определяется по формуле т т

D=[Q1{x)d% fQx(в)(т — в)дГв, (2. 142)

о о

которая с учетом условия оптимальности (2.121) может быть приведена к виду

ТП

(2. 143)

ft-1

Согласно предыдущему параграфу при фп+г^О в ус­ловии (2.118) имеет место знак равенства и

т

Я=2^+Фл+А. (2-144)

k=l

Поскольку, как было показано, то дисперсия

ошибки х убывает с увеличением Си.

2.5. УСЛОВИЯ ОПТИМАЛЬНОСТИ УПРАВЛЕНИЯ

С УЧЕТОМ ПРОТИВОДЕЙСТВИЯ ЦЕЛИ

Как указывалось выше, задача наведения с учетом противодействия цели может рассматриваться как зада­ча теории игр, в которой цель выбирает управление v объектом (2.2) таким образом, чтобы обеспечить макси­мальное значение

I=M{F[x{ta)]} (2.145)

в то время как наводящийся объект стремится его ми­нимизировать. Управления и и v в общем случае удовле­творяют как «жестким» ограничениям, состоящим в замкнутости областей их возможных значений

и

u£U

v£V,

(2.146)

(2.147)

так и изопериметрическим вида

_ 4 —

м

j HrQu«^j

<са;

(2.148)

м

п

(2.149)

Существенной особенностью рассматриваемой игровой задачи является ограниченность информации о векторе фазовых координат х, которой располагают наводящий­ся объект и цель. В частности, предположим, что наво­дящийся объект использует при наведении измерения

**=/«(■*.»•). (2.150)

а цель — измерения

(2. 151)

где Пи, tlv — ошибки измерений, являющиеся случайными функциями с известными обоим «игрокам» статистически­ми характеристиками. Предположим также, что обоим «игрокам» известны статистические характеристики на­чальных значений вектора фазовых координат x(t0), по­стоянные си, cv и области U и V.

Различие информации, используемой «игроками» при управлении, определяет особенность рассматриваемой игры, как игры с ненулевой суммой [2]. Обозначим через u0(za, t) и v0{zv, t) оптимальные стратегии «игроков». Тогда «о(гги, 0 минимизирует функционал (2.145) при ус­ловиях (2.146), (2.148) и замене оператора безусловно­го математического ожидания в этих выражениях услов­ным при заданномг„, т. е.

Подпись:mmM{F[x{tB)], }=minM [/„ (ю, v0, х, t)z ]

U&J “ U&J “

Подпись: м Ц uTQuudt zu Подпись: CU‘ Подпись: (2.153)

при условии

Оптмальное управление Vq определяется аналогично maxM{F[x(g]z } =maxM[lu(x, u0, t)z] (2.154)

при условии

(2.155)

Поскольку MIu и MIV в общем случае различны, то игра будет иметь ненулевую сумму. Условия (2.152) и (2.154) образуют систему функционалов и должны ре­шаться одновременно относительно «о и v0. Зависимость «о иг»0 от измеряемых векторов zu и zv вызывает сущест­венные трудности при оптимизации управления и состав­ляет особенность рассматриваемой игры, как игры с не­полной информацией.

В более общем случае критерий игры может быть за­писан в виде

/ = М{/Ч.*(д]+||70[л;, и, г», (2.156)

На основании задачи 2 условия оптимальности уп­равлений игроков u(zu, t) и v(zv, t) для функционала (2.156) могут быть записаны с помощью стохастического принципа максимума в виде системы уравнений:

шах Ж///[кг, я, v0(zv, /), t) t )=0; (2.157)

u(*U { zu * ?

Подпись: где Подпись: minM (H[t, v, u0(za, t), /] *єк I УЧЕТ ОГРАНИЧЕНИЙ СТРУКТУРЫ 8 УСЛОВИЯХ ОПТИМАЛЬНОСТИ Подпись: (2.158)

I <oJ

H[x, U, V, /]=—/0(ЛГ, U, V, U, V, t).

(2. 159)

Система уравнений относительно гр (/)

Подпись: (2.160)_ дН

dt дхі

Подпись: ^(0=Подпись: , /=1,2... п. (2.161)интегрируется при граничных условиях ^ [*«■)]

дхі

В случае линейного объекта (2.2)

x=Ax—BunJrBvv—(t); | ^2 J02)

dc(t0)=x° J

и квадратичного критерия качества

/о(ЛГ, и, V, t)=$+2UTQull—fn+2VTQvV. (2.163)

Здесь qu, — положительно-определенная и от­

рицательно-определенная матрицы соответственно;

ф“+2 и ф®+2— постоянные коэффициенты.

Н(х, и, V, t)=—fn+24THu1l — fn+2VTQvV— (2.164)

+Ф7′(0И^+5«а + ^+|].

При этом условия оптимальности (2.157) и (2.158) становятся независимыми и управления «игроков» свя­заны между собой лишь через оценки конечного значения вектора фазовых координат x(tB).

В частном случае zu=zv=,z условия (2.157) и (2.158) совпадают. Это соответствует предположению о сущест-

Подпись: шах min М(//(*, u, v, ф, /) иви vev і Подпись: (2. 159)
image44

вовании седловой точки в рассматриваемой игре при ин­формации z(t) и чистых стратегиях u(z, t) и v(z, t). Ус­ловия оптимальности в этом случае могут быть записаны в виде

= minma х МІН (к, иу v, ф, /)| * 1.

«єг/ I t’0j

Очевидно, что для линейного объекта, представленно­го в виде уравнения (2.162) и квадратичного критерия (2.163), условие (2.159) выполняется и игра имеет седло­вую точку.